El problema: Clusterizar diseños
¿Como hago para clasificar estilos de banners?
Input data
Se sacan metadatos de un archivo de photoshop
y : Distancia desde arriba
x : Distancia desde la izquierda
w : Ancho (width)
h : Alto (height)
Estrategia 1:
library(umap)
library(dbscan)
umap_data<- umap(data)
cl <-hdbscan(x = umap_data, minPts = 3)
Validacion
En terminos de negocio…¿sirve hacer esto?
Estrategia 2
Surge la necesidad de transformar los datos
Opciones
Estandarizacion (z-score): Representa el numero de desvios estandar arriba o debajo del valor resultante. Útil para variables normalmente distribuidas
Normalizacion (min-max scaler): Permite llevar los valores entre 0 y 1. Útil para comparar variables de diferentes ordenes de magnitud (Precio de una casa y los m2 que ocupa)
¿Puedo usar estas transformaciones en estos datos?
mi nueva variable x’ es: la linea roja dividida la linea azul
mi nueva variable y’ es: la linea roja dividida la linea azul
mi nueva variable areaRelativa es: el area del cuadrado chiquito dividido la del rectangulo grande
mi nueva variable disposicion es: el alto dividido por el ancho